Classification et extraction des documents complexes à partir des images issues d'un périphérique mobile : application aux documents d'identité

نویسندگان

Ahmad Montaser Awal

Abdullah Almaksour

چکیده

We propose in this paper a document image classification method. In contrary to most of existing systems, the proposed approach allow locating the document and recognizing its type simultaneously. First, a knowledge base of document models is created from reference images. Training images are not indispensable and though only one reference image is enough to create a document model. Then, key-points are extracted from the request image and matched against the models in the knowledge base. Once the document model is found, a more accurate matching is applied in order to extract the document from the image. The matching process is optimized in order to guarantee an execution time independent from the number of document models. Finally, the document quality is estimated in order to reject unkown documetns. Our system has been evaluated on a set of 2494 real documents MOTS-CLÉS : Classification, Document d’identité, Descripteurs locaux, SURF, Flann, KDTree.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Enrichissement sémantique de documents XML représentant des tableaux

Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiqu...

متن کامل

Modèles de langue pour la mise à jour d'un profil d'entité

RÉSUMÉ. Dans cet article nous souhaitons renvoyer à partir de documents issus du Web, ceux apportant des informations nouvelles sur une entité donnée. Ces documents peuvent ainsi servir à mettre à jour un profil existant (par exemple une page Wikipedia) de cette entité. Notre approche se base initialement sur un appariement des mentions de l’entité afin de renvoyer un premier ensemble de docume...

متن کامل

Analyse OLAP d'un entrepôt de documents XML

RESUME. Les systèmes OLAP basés sur des entrepôts de données sont aujourd’hui bien intégrés dans les organisations, ils facilitent le traitement et l’analyse de l’information pour la prise de décision. Le développement du Web a conduit à l’accroissement du volume de données traité, ainsi qu’à la diversification des sources de l’information. Ce problème de diversification a été en partie résolu ...

متن کامل

Fouille de données complexes et logique floue : extraction de motifs à partir de bases de données multidimensionnelles. (Fuzzy and Complex Data Mining: Knowledge Discovery from Multidimensional Data)

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Nouvelles perspectives en extraction d'information

Les techniques dites d'extraction d'information (EI) ont connu un essor considérable ces dix dernières années. L'EI consiste à extraire de documents des informations précises et à les structurer sous une forme prédéfinie. Il s'agit en général de remplir des formulaires donnant certaines caractéristiques concernant des entités ou des événements évoqués dans les textes ainsi que des relations ent...

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره شماره

صفحات -

تاریخ انتشار 2016

Classification et extraction des documents complexes à partir des images issues d'un périphérique mobile : application aux documents d'identité

نویسندگان

چکیده

منابع مشابه

Enrichissement sémantique de documents XML représentant des tableaux

Modèles de langue pour la mise à jour d'un profil d'entité

Analyse OLAP d'un entrepôt de documents XML

Fouille de données complexes et logique floue : extraction de motifs à partir de bases de données multidimensionnelles. (Fuzzy and Complex Data Mining: Knowledge Discovery from Multidimensional Data)

Nouvelles perspectives en extraction d'information

عنوان ژورنال:

اشتراک گذاری